Un modèle Bayésien pour l'Agrégation des documents XML

نویسندگان

  • Najeh Naffakhi
  • Mohand Boughanem
  • Rim Faiz
چکیده

In this paper, we are interested in aggregated search in structured XML documents. We present a structured information retrieval model based on the Bayesian networks theory. Relations query-terms and terms-elements are modeled through probability. In this model, the user’s query starts a process of propagation to recover the elements. Thus, instead of retrieving a list of elements that are likely to answer partially the user’s query, our objective is to build a virtual elements that contain relevant, non-redundant and complementary elements, that are likely to answer better the query that elements taken separatelly. We evaluated our approach using INEX 2005 collection and presented some empirical results for evaluating the impact of the aggregation approach. MOTS-CLÉS : recherche agrégée, réseaux bayésiens, redondance, complementairité.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Réseau bayésien pour un modèle de Recherche d'Information agrégée dans des documents structurés

In this paper, we are interested in aggregated search in structured XML documents. We present a model for the structured information retrieval, based on the Bayesian networks theory. Relations query-terms and terms-elements are modelled through probability measures. In this model, the user’s query starts a process of propagation to recover the relevant and noredundant elements. Thus, instead of...

متن کامل

Une représentation en graphe pour l'enseignement de XML

XML est un format actuellement très utilisé. Dans le cadre des formations en informatique, il est indispensable d’initier les étudiants à ce format et, surtout, à tout son éco-système. Nous avons donc mis au point un modèle permettant d’appuyer l’enseignement de XML. Ce modèle propose de représenter un schéma XML sous la forme d’un graphe mettant en valeur les caractéristiques structurelles des...

متن کامل

Exploitation des connaissances d'UMLS pour la recherche d'information médicale. Vers un modèle bayésien d'indexation

RÉSUMÉ. La recherche d’information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l’impact de l’exploration d’une base de connaissance, nommée méta thésaurus UMLS pour la recherche d’information médicale. D’abord, l’indexation par concepts d’UMLS extrait dans des textes ne montre qu’une légère amélioration de MAP(Mean Average Precision) p...

متن کامل

Statistical learning for image-based personalization of cardiac models. (Apprentissage statistique pour la personnalisation de modèles cardiaques à partir de données d'imagerie)

Cette thèse porte sur un problème de calibration d’un modèle électromécanique de cœur, personnalisé à partir de données d’imagerie médicale 3D + t ; et sur celui — en amont — de suivi du mouvement cardiaque. Les perspectives à long terme de la simulation personnalisée de la fonction cardiaque incluent l’aide au diagnostic et à la planification de thérapie, ainsi que la prévention des risques ca...

متن کامل

Optimisation directe des poids de modèles dans un prédicteur Bayésien naïf moyenné

Résumé. Le classifieur Bayésien naïf est un outil de classification efficace en pratique pour de nombreux problèmes réels, en dépit de l’hypothèse restrictive d’indépendance des variables conditionnellement à la classe. Récemment, de nouvelles méthodes permettant d’améliorer la performance de ce classifieur ont vu le jour, sur la base à la fois de sélection de variables et de moyennage de modèl...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2011